package com.dmcb.trade.business.crawlers.article;

import com.dmcb.common.business.utils.DateUtil;
import com.dmcb.trade.business.constants.CrawlConstant;
import com.dmcb.trade.business.entities.Article;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.springframework.stereotype.Service;

import java.text.SimpleDateFormat;
import java.util.Calendar;
import java.util.Date;

/**
 * 企业服务汇文章解析
 * Created by 黑米 on 2016/11/17.
 */
@Service
public class FuWuHuiParser extends BaseParser {

    /**
     * 网站URL网址
     *
     * @return 链接
     */
    @Override
    protected String url() {
        return CrawlConstant.FUWUHUI_URL;
    }

    /**
     * 获取标题选择器
     *
     * @return 标题选择器
     */
    @Override
    protected String titleSelect() {
        return "h2.page-title";
    }

    /**
     * 获取日期选择器
     *
     * @return 发布日期选择器
     */
    @Override
    protected String dateSelect() {
        return "div.post_date";
    }

    /**
     * 获取正文内容选择器
     *
     * @return 正文内容选择器
     */
    @Override
    protected String bodySelect() {
        return "div.post_content";
    }

    /**
     * 获取封面选择器
     *
     * @return 封面选择器
     */
    @Override
    protected String coverSelect() {
        return "div.post_content>p img[src],div.post_content>div>p img[src]";
    }

    /**
     * 设置发布时间
     *
     * @param doc     网页
     * @param article 文章
     */
    @Override
    protected void setPostDate(Document doc, Article article) {
        Element element = doc.select(dateSelect()).first();
        Calendar cal = Calendar.getInstance();
        if (element != null) {
            int num;
            String time = text(element);
            time = time.replace("发布时间：","").trim();
            if(time.contains("分")){ //如果有分钟，则获取多少分钟，
                num =Integer.parseInt(time.substring(0,time.indexOf("分")))  ;
                cal.add(Calendar.MINUTE, -num);
                SimpleDateFormat formatter = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss");
                time=formatter.format(cal.getTime());
            }
            else  if(time.contains("小时")){//如果有小时，则获取多少小时，
                time = time.replace(" ",""); //去除时间的空格
                num =Integer.parseInt(time.substring(0,time.indexOf("小时")))  ;
                cal.add(Calendar.HOUR_OF_DAY,-num);
                SimpleDateFormat formatter = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss");
                time=formatter.format(cal.getTime());
            }
            else if(time.contains("天")){//如果有天，则获取多少天，
                num =Integer.parseInt(time.substring(0,time.indexOf("天")))  ;
                cal.add(Calendar.DAY_OF_MONTH, -num);//得到前5
                SimpleDateFormat formatter = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss");
                time=formatter.format(cal.getTime());
            }
            Date date = DateUtil.parseDate(time);
            if (date != null) {
                article.setPostTime(date);
            }
        }
    }

    @Override
    protected String platform() {
        return "企业服务汇";
    }
}
